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Introduzione 

L'associazione di un Persistent Identifiers (PI) a una risorsa digitale 
è considerata oggi una best practice che contribuisce alla risoluzione 
del problema del reperimento affidabile delle risorse in rete, andan¬ 
do ben oltre la soluzione dell'errore Internet 404. Attualmente i PI 
sono considerati un mezzo per poter garantire non solo l'identifi¬ 
cazione e l'accesso nel lungo periodo, ma anche la certificazione, 
l'autorevolezza e l'affidabilità delle risorse stesse a patto però che 
l'implementazione dell'infrastruttura prenda in considerazione non 
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solo i requisiti tecnici, ma soprattutto quelli organizzativi, di pro¬ 
cesso, di comunità, di conservazione etc. L'associazione di un PI a 
una risorsa digitale può essere usata come un concreto strumento 
di localizzazione affidabile, ma, allo stesso tempo, può supportare 
la certificazione dell'autenticità della risorsa, della sua provenienza, 
dei suoi diritti di sfruttamento etc. 

Ovviamente la garanzia di una reale persistenza degli identifica¬ 
tivi è principalmente legata all'impegno mostrato da un'organizza¬ 
zione nell'assegnarli e gestirli. Questo impegno deve declinarsi nel¬ 
l'adozione di precise politiche di servizio, nell'implementazione di 
specifiche soluzioni tecnologiche, nella definizione di un modello di 
business sostenibile, nell'identificazione della comunità di riferimen¬ 
to, nel rispetto di opportuni standard condivisi internazionalmente. 
La reale persistenza di un sistema di identificazione si deve quindi 
basare sul rispetto di una serie di criteri qualitativi e quantitativi ve¬ 
rificabili così come proposto dai risultati di iniziative internazionali, 
quali NESTOR 1 («NESTOR Catalogue of criteria for assessing thè 
trustworthiness of PI systems») e APARSEN 2 (Bazzanella et al.). 

Attualmente sono disponibili diverse tecnologie e standard per 
l'implementazione di un sistema di attribuzione di PI; manca tut¬ 
tavia un accordo sulla loro adozione, anche perché alcuni di questi 
sistemi sono nati come soluzioni tecniche senza il supporto delle 
comunità di utenti che si aspettano dai PI livelli di servizio. Siste- 


1 NESTOR, http://www.langzeitarchivierung.de/eng, è un network di competen¬ 
za tedesco sulla digitai preservation e ne fanno parte biblioteche, archivi, musei e 
esperti del settore. 

2 Alliance for Permanent Access to thè Records of Science Network, http://www. 
alliancepermanentaccess.org/index.php/current-projects/aparsen, è un network of 
excellence sulla digitai preservation finanziata dalla commissione europea che si 
occupa di studiare tuti gli aspetti della conservazione dei record scientifici, dagli 
standard alla loro identificazione, dalle soluzioni di Storage alla creazione di un 
centro di competenza virtuale europeo. 
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mi come il PURL 3 oppure i Cool URI 4 (Berners-Lee) presentano 
indubbiamente notevoli vantaggi (il più rilevante tra questi è la 
loro immediata dereferenziabilità 5 attraverso il protocollo HTTP 6 ), 
ma il limite di queste soluzioni è che la loro persistenza non è in 
principio garantita da una terza parte indipendente e autorevole. 
Inoltre, nelTambito del progetto europeo APARSEN è stata condotta 
un'indagine i cui risultati mostrano che un numero limitato di ap¬ 
procci, come il Digital Object Identifier DOI (33%), il sistema Handle 
(29%) e gli identificatori URN-based (Moats) (25%), sembrano ormai 
prevalere a livello europeo (Bazzanella et al.). 

Una particolare attenzione merita in ogni caso il Cool URL Com'è 
noto il Cool URI è un approccio alla persistenza delle URL basato 
sulla loro progettazione. Questo approccio principalmente tecnico è 
considerato una best practice dal W3C per Timplementazione delle 
URI del semantic web e dei Linked Data. 7 L'assunzione di base è 
che una progettazione corretta delle URI dovrebbe ridurre i casi in 
cui risulterà necessario cambiarle, garantendone la loro stabilità nel 
tempo. Un esempio di questa best practice è quello di evitare di 
esplicitare l'estensione delle pagine web come .php o .asp, in modo 
che se cambia la tecnologia di base (da PHP ad ASP) la URI rimane 

3 OCLC Persistent URL è un servizio che consente agli utenti di generare delle URL 
con certe caratteristiche di persistenza riferendo a queste le URL delle proprie risorse 
considerate più soggette a cambiamenti, migrazioni, ecc. URL http://purl.oclc.org. 

4 Cool URI è una best-practice del W3C che intende rendere persistenti le URL 
tramite l'adozione di una serie di regole e pratiche di gestione in grado di ridurre 
i casi in cui risulterebbe necessario cambiarle o dismetterle, http://www.w3.org/ 
Provider / Style / URI.html. 

5 La locuzione "dereferenziare una URI" è riferita alla capacità di recuperare la 
rappresentazione della risorsa identificata da quella URI tramite una applicazione 
(es. browser). In altre parole è la capacità di accedere ad esempio a una pagina web, 
o a un PDF all'intero di un browser tramite una URL. 

6 http://www.ietf.org/rfc/rfc2616.txt. 

7 http://www.w3.org/TR/2007/WD-cooluris-20071217, http://www.w3.org/ 
Designlssues/LinkedData.html. 
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la stessa. In questa ottica, la persistenza si baserebbe esclusivamente 
sull'impegno della singola istituzione; s'instaura così una relazione 
di trust diretta tra l'utente e l'istituzione stessa, senza mediazioni. In 
questo senso il trust è il livello di fiducia che un utente ha nella ca¬ 
pacità di un'istituzione di mantenere le caratteristiche dichiarate del 
servizio offerto. Il livello di fiducia viene ciclicamente verificato du¬ 
rante l'interazione che l'utente ha con il servizio stesso, e dove si ha 
una conferma positiva, il trust si rafforza; in caso contrario decresce. 
È ben noto, purtroppo, che l'impegno della singola istituzione non è 
più sufficiente a garantire né la persistenza della URL né tanto meno 
la certificazione delle risorse in termini di provenienza, autenticità, 
integrità, conservazione etc. Nella pratica, le risorse si muovono 
sulla rete, vengono modificate o cancellate a causa di una infinità di 
fattori che non possono essere sempre predeterminati dalle politiche 
di gestione dei contenuti delle singole istituzioni, né tanto meno 
governate da best practice esclusivamente tecniche. Un caso tipico è 
quando un' istituzione chiude le sue attività perché viene comprata 
da un'altra istituzione o viene soppressa, oppure semplicemente 
cambia nome. In questi casi gli oggetti possono essere rinominati 
per essere adattati al workflow interno della nuova istituzione, o 
ceduti ad altre istituzioni, o nel peggiore dei casi cancellati perché 
non più corrispondenti agli obiettivi istituzionali. E evidente che 
tutte queste azioni possono produrre l'invalidazione delle vecchie 
URL indipendentemente da come queste siano state costruite. Que¬ 
sto potrebbe non essere un problema se l'istituzione non gestisce 
contenuti di valore scientifico, culturale o amministrativo, ma cosa 
diversa è se la medesima sorte la subiscono istituzioni come editori 
scientifici, biblioteche, archivi, etc. In questi casi, ad esempio, biblio¬ 
grafie basate su semplici URL o anche Cool URI, facenti riferimento 
a risorse che erano presenti negli archivi di queste istituzioni, non 
potranno più essere usate, ad esempio, per verificare il lavoro scien- 
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tifico o per calcolare indici bibliometrici. La cosa più critica, però, è 
l'impossibilità di implementare sistemi di verifica dell'autenticità, 
della provenienza e dell'integrità di queste risorse in assenza di una 
terza parte che si faccia garante dell'associazione nome - risorsa. 

L'uso dei PI consente, quindi, di inserire non solo nel web ma 
anche nel nuovo web semantico quel necessario livello di trust che 
attualmente manca allo scenario così come auspicato dai risultati 
del seminario sui PI e Linked Open Data confluiti nel Den Haag 
Manifesto, 8 a cui la Fondazione Rinascimento Digitale ha contribui¬ 
to attivamente. Questo livello di trust è implementato attraverso 
l'identificazione di una terza parte indipendente e autorevole (come 
ad esempio le Biblioteche Nazionali) con un preciso mandato che 
tenga in considerazione non solo i requisiti tecnici, ma anche quelli 
di comunità (ad esempio la granularità dell'identificativo), orga¬ 
nizzativi (autorevolezza della Registration Authority riconosciuta 
nel dominio di applicazione, impegno sulla durata del servizio) e 
di processo (policy di dominio sulla selezione delle risorse, etc.) 
(Bellini et al., «Semantics-Aware Resolution of Multi-part Persistent 
Indentifiers»; «Persistent Identifiers distributed System for Cultural 
Heritage digitai objects»). 


Il progetto NBN Italia 

Il progetto NBN Italia (NBN:IT) ha inteso realizzare un servizio di 
identificazione persistente basato sullo standard NBN che assegna 
alle biblioteche nazionali la responsabilità esclusiva della gestione 

s http://www.knowledge-exchange.info/Admin/Public/DWSDownload.aspx? 
File=%2fFiles%2fFiler%2fdownloads%2fPersID%2fWorkshop+POID%2fDen+ 
Haag+Marrifesto+20110825_2.pdf. Si noti in ogni caso la differenza tra l'identificatore 
di tipo URL appena citato e gli identificatori riportati alle precedenti, costruiti come 
Cool URI. 
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del sottodominio nazionale NBN:IT. Partendo dall'attuale orienta¬ 
mento per i sistemi NBN, derivato da progetti come PersID, da 
report come CENL Task Force on Persistent Identifiers e dalle racco¬ 
mandazioni contenute ne The National Libraries Resolver Discovery 
Service («CENL Task Force on Persistent Identifiers, Report 2007»), 
dove se ne sottolinea il ruolo a supporto della digitai preservation, in 
Italia si è consolidata l'idea di legare NBN:IT a un servizio che è isti¬ 
tuzionalmente affidato alle biblioteche nazionali: il deposito legale. 
I primi studi intorno al NBN sono cominciati nel 2007 su iniziativa 
della Fondazione Rinascimento Digitale con il prezioso supporto 
dell'Università Statale di Milano con significativi risultati dal punto 
di vista della ricerca (Bellini et al., «Persistent Identifiers distributed 
System for Cultural Heritage digitai objects»; «Semantics-Aware Re¬ 
solution of Multi-part Persistent Indentifiers»; Bellini e Ceravolo). Le 
attività sono poi proseguite con una prima fase di sperimentazione 
che ha visto lo sviluppo dell'architettura e il test di vari prototipi 
(Bellini et al., «Persistent Identifier Distributed System for Digital 
Libraries, Information Technology»; «Persistent identifiers: jNBN, a 
JEE application for thè management of a national NBN infrastruc- 
ture»). Infine, in considerazione della vocazione di NBN verso la 
digitai preservation, il progetto NBN:IT è confluito nell'ambito del 
Deposito Legale nazionale, diventandone oggi parte integrante. L'i¬ 
niziativa NBN vede oggi coinvolti il consorzio di Magazzini Digitali 
(Vignocchi, Bergamin e Messuti; «Le linee guida per l'accesso aperto 
alle tesi di dottorato») per il deposito legale composto dalla Biblio¬ 
teca Nazionale Centrale di Firenze (BNCF), la Biblioteca Nazionale 
Centrale di Roma (BNCR), la Biblioteca Nazionale Marciana di Ve¬ 
nezia e la Fondazione Rinascimento Digitale (FRD) e la CRUI che 
sovraintende la sperimentazione con le tesi di dottorato. Attualmen¬ 
te il progetto NBN è in fase avanzata di sviluppo e i suoi principali 
obiettivi possono essere riassunti nei seguenti punti: 
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1. la creazione di un registro nazionale di nomi stabile e affidabile 
come strumento a supporto del deposito legale per la certifica¬ 
zione degli oggetti digitali prodotti dalle istituzioni culturali, 
scientifiche e educative, 

2. l'accesso permanente alle risorse digitali prodotte dalle istitu¬ 
zioni culturali italiane, incluso il materiale digitalizzato o non 
ancora pubblicato, 

3. la condivisione di politiche per la conservazione di lungo 
periodo degli oggetti digitali, 

4. la sostenibilità dei costi del servizio e le responsabilità di 
gestione dei nomi da parte delle istituzioni. 

NBN: un identificatore a supporto del deposito legale 

La decisione di associare un servizio di identificazione persistente a 
un servizio di deposito legale ha delle implicazioni importanti, che 
meritano qualche considerazione. La definizione del nuovo servizio 
NBN prende avvio dalle considerazioni espresse nel report CENL 
Task Force on Persistent Identifiers [2] e nelle CENL Recommen- 
dation - The National Libraries Resolver Discovery Service (RDS) 
(«CENL Task Force on Persistent Identifiers, Report 2007») e si con¬ 
solida nell'idea di collegare NBN a un servizio specifico, andando 
ben oltre la sola esigenza di identificazione e realizzando un sistema 
a valore aggiunto. Già nel 2007 i report del CENL promuovevano 
l'adozione di NBN da parte delle Biblioteche Nazionali, scoraggian¬ 
do l'uso di altri sistemi. Inoltre, l'idea che NBN fungesse anche 
da risolutore di ultima istanza di DOI, una volta che una risorsa 
digitale non fosse stata più accessibile dall'archivio dell'editore, ci 
fa comprendere la differenza e la complementarietà di NBN rispetto 
agli altri sistemi. L'iniziativa italiana ha recepito in pieno queste 
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indicazioni spingendo le implicazioni di queste scelte ben oltre la 
sfera applicativa. Infatti, il conferimento all'identificativo NBN di 
significati ulteriori, a nostro avviso, consente di comunicare quel 
valore di "fiducia" atteso dagli utenti dei servizi erogati dalle pub¬ 
bliche amministrazioni in generale, e, in particolare, dei servizi di 
conservazione e identificazione. 

Il ruolo iconico di NBN 

Un identificatore persistente utilizzato da organismi istituzionali 
per identificare un'entità o un oggetto prodotto dall'organizzazione 
stessa come risultato di un processo amministrativo e burocrati¬ 
co ha un potenziale ruolo iconico nella definizione dei requisiti di 
trust nell'information society («Final Report of thè Project Team of 
CEN/ISSS eGovernment Focus Group, CEN»; Winer; Wilson). Luh- 
mann («Trust: a mechanism for thè reduction of social complexity») 
definisce il trust come un meccanismo per ridurre l'incertezza, la 
complessità e il rischio che percepiscono gli utenti riguardo all'entità 
in esame. In quest'ottica, quindi, gli utenti si aspettano che l'out¬ 
put di un sistema ritenuto affidabile, sia corretto e in linea con le 
loro aspettative. La reiterazione di questa conferma contribuisce 
a stabilizzare questa fiducia. L'attribuzione di un identificativo a 
una risorsa, assegnato da parte di una pubblica amministrazione, 
dovrebbe implicare il superamento da parte della risorsa stessa di un 
processo ufficiale di riconoscimento (carta d'identità), di presa in ca¬ 
rico (numero di protocollo), di tracciamento (codice fiscale, targa), e 
così via. La possibilità di verifica dell'avvenuto processo è garantita 
non solo dal mantenimento in appositi registri (anagrafe, protocollo, 
etc.) dell'associazione tra l'identificativo assegnato e l'entità oggetto 
del processo, ma anche dalla loro immediata accessibilità a fini di 
controllo. Quindi, la sola presenza di un identificativo di questo 
tipo conferisce all'entità a cui è assegnato, un livello di trust supe- 
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riore rispetto a entità della stessa natura che ne sono sprovviste. Il 
ruolo iconico di un identificatore deriva, quindi, dal fatto che la 
sua assegnazione (o adozione) è subordinata al superamento di un 
processo le cui modalità di attuazione sono conosciute, accettate e 
formalmente e/o legalmente disciplinate. In accordo a questa visio¬ 
ne si è ritenuto inevitabile dotare il processo di deposito legale di un 
sistema di identificazione delle risorse stesse. L'associazione di un 
NBN a una risorsa certificherà pertanto all'utente che quella stessa 
risorsa è stata legalmente depositata (o che è in corso il deposito 
legale) in accordo alle regole che disciplinano questo processo. La 
dimostrazione dell'avvenuto processo può essere perpetrata solo 
tramite la risoluzione e confermata dall'utente finale. 

Il rapporto tra NBN e DOI/Handle 

Dopo un'iniziale proliferazione di tecnologie e proposte di standar¬ 
dizzazione, attualmente il dominio sembra pragmaticamente foca- 
lizzato su soluzioni come DOI, Handle e identificativi URN based 
come NBN. I sistemi tra loro non sono comunque equivalenti. Infatti, 
sia Handle che DOI (che si basa su l'infrastruttura Handle) possono 
essere assegnati a qualunque tipo di risorsa e la loro funzione prin¬ 
cipale è quella di identificazione (per Handle) o di indirizzamento 
alle pagine degli editori dove è possibile acquistare la risorsa (per 
DOI). Nessuno dei due però può dirsi strettamente subordinato 
a un workflow/processo specifico e certificato come avviene ad 
esempio per l'assegnazione di ISBN (processo di pubblicazione) o 
per il rilascio della carta di identità (processo di riconoscimento). 
Infatti, anche se il DOI è generalmente usato dagli editori nella fase 
finale del processo di pubblicazione, chiunque può acquisire tale 
identificativo commerciale per le proprie risorse senza che queste 
ultime siano sottoposte necessariamente a un processo di selezione, 
catalogazione, archiviazione, etc. Il DOI, come Handle, è quindi un 
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identificativo "generico" (avere un DOI o un Handle di per sé, non 
dice niente di più del fatto che la risorsa sia identificata su Internet) 
e pertanto supporta l'erogazione di altri tipi di servizi come quelli 
citazionali, che non sono in alternativa a quelli fomiti attraverso 
NBN, ma vi si aggiungono, completando l'offerta. Infine, sia per il 
DOI che per Handle, la responsabilità della stabilità delle risorse e 
della loro conservazione è interamente affidata al content provider, 
quindi, nel caso l'istituzione non abbia adottato specifiche politiche 
di conservazione, il rischio che nel lungo periodo il DOI non risolva 
più correttamente è concreto. Diversamente, NBN associato al ser¬ 
vizio di deposito legale assicura un'affidabilità maggiore in quanto 
beneficia dell'assunzione di responsabilità della pubblica ammini¬ 
strazione di conservare nel lungo periodo le risorse. In quest'ottica, 
la garanzia di risoluzione di un NBN nel lungo termine è data dal 
fatto che questo punterà sempre almeno alla copia conservata nel 
deposito legale. 

Attualmente le risorse possono già ricevere più di un identificati¬ 
vo durante il loro ciclo di vita. Ad esempio, un articolo pubblicato 
su una rivista non Open Access e depositato in un repository istitu¬ 
zionale OA basato su un sistema DSpace il cui dominio è registrato 
al CNRI, avrà come minimo un ID interno OAI (non risolvibile), un 
Handle (risolvibile alla risorsa depositata nel repository) e un DOI 
(risolvibile principalmente alla copia depositata presso l'editore), 
quindi l'introduzione di un nuovo identificativo con le caratteri¬ 
stiche precedentemente descritte non potrà che rappresentare un 
valore aggiunto per la risorsa stessa. Infatti, questi identificativi, 
tutti gestiti dai metadati descrittivi associati alla risorsa, di per sé 
non sono in contrasto in quanto, come abbiamo detto, assolvono 
a servizi diversi, e il NBN rappresenta un metadato aggiuntivo in 
grado di informare l'utente che esiste una copia della risorsa legal¬ 
mente depositata alla biblioteca nazionale. La prova del deposito è 
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ottenibile tramite il servizio di risoluzione del nome. 

Lo standard IETF RFC 3188 - National Bibliography 

Number 

Il PI definito come National Bibliography Number (NBN) (Hakala) 
nasce nel contesto del ruolo e dalle responsabilità che le biblioteche 
nazionali hanno nel campo del controllo bibliografico universale (in 
particolare con le bibliografie nazionali). 9 Si tratta di uno standard 
basato su Uniform Resource Name (URN) (Masinter e Sollins; Moats; 
Daigle et al.) e definito dall'RFC 3188 in ambito IETF. Lo standard 
NBN riprende molti degli aspetti definiti nell'RFC 2288 (Lynch, Pre- 
ston e Daniel) nel quale si fa riferimento alTutilizzo degli identificato¬ 
ri bibliografici come Plnternational Standard Book Number (ISBN), 
Tlnternational Standard Serials Number (ISSN) («NISO/ANSI/ISO 
2108:1992 Information and documentation - International standard 
book number (ISBN)»; «ISO 3297:1986 Documentation - Internatio¬ 
nal standard serial numbering (ISSN)»), e il Serial Item and Contri- 
bution Identifier (SICI) («NISO/ANSI Z39.56-1997 Serial Item and 
Contribution Identifier»). I namespace basati sullo standard URN 
(quindi anche NBN) sono fortemente orientati alla sintassi dei no¬ 
mi e alle responsabilità della gestione dei sub-namespace. Infatti, 
esistono diversi gradi di libertà per Timplementazione del servizio, 
che può essere diverso per comunità diverse. Nel caso di NBN, lo 
standard prevede una ripartizione di responsabilità simile ai domini 
DNS dove è previsto un suffisso che identifica il paese di riferimento 
(es. NBN:IT:xxxx oppure NBN:DE:yyyy). 

Quindi la struttura tipica di un NBN è la seguente: 

URN:NBN:<country code>:<sub-namespace>-<assigned NBN> 

9 Per il concetto di Controllo Bibliografico Universale si veda Solimine (Controllo 
bibliografico universale). 
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dove "country code" è il codice del Paese, indicato secondo lo 
standard ISO 3166, il "sub-namespace" è il codice del sottodominio 
e "assigned NBN" è la stringa di caratteri scelta. 

La responsabilità per la gestione del sottodominio nazionale è 
delegata, come previsto dallo standard, alle biblioteche nazionali 
di ogni paese (Hakala). NBN è stato registrato al registro Internet 
Assigned Numbers Authority (IANA) degli URN nell'ambito del 
Nordic Metadata Project su proposta della Conference of Directors 
of National Libraries (CDNL) e Conference of European National 
Libraries (CENL). Il primo obiettivo dello standard era quello di 
avere un sistema di identificazione per tutte quelle risorse digitali 
che non possedevano un identificativo perché fuori da circuiti di 
produzione specifici, come avviene invece per i libri con ISBN o i 
periodici con ISSN. Esempi di queste risorse che andavano a collo¬ 
carsi nella cosiddetta letteratura grigia sono le tesi di dottorato, i 
rapporti tecnici, gli oggetti digitalizzati come i manoscritti antichi 
etc. Le attuali iniziative di NBN in Germania 10 come in Olanda, ad 
esempio, pur mantenendo una certa autonomia nell'implementa- 
zione del servizio (da qui il tentativo di avere policy e un sistema 
di risoluzione comuni a livello europeo sperimentato dal progetto 
PersID 11 ), hanno una chiara vocazione verso la digitai preservation 
delle risorse identificate. Questa relazione è forte a tal punto che il 
riferimento alla conservazione delle risorse digitali identificate dal 
namespace NBN sarà esplicitato nella prossima versione dell'RFC 
3188. Nel solco di questa visione si colloca l'attività della Fondazio¬ 
ne Rinascimento Digitale nell'ambito del gruppo di lavoro IETF 12 

10 http: //www.persistent- identifier.de/ english/3352-EPICUR_policy.php. 

n PersID- Building a persistent identifier infrastructure, http://www.persid. 
org. Il progetto PersID, finanziato dalla SURF Foundation, aveva come scopo la 
progettazione di un metaresovler tra i vari sistemi NBN europei. 

12 L'IETF ha attivato un gruppo di lavoro aperto per la revisione dello standard 
3188. 
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per la revisione dell'RFC 3188 e di gruppi di progetto internazionali 
come PersID e la collaborazione con il Ministero dei beni Culturali 
(MiBAC) e la Conferenza dei Rettori delle Università Italiane (CRUI) 
per la realizzazione di un sistema analogo nel nostro paese. 


Il servizio NBN Italia 

Sulla base dei risultati raggiunti dalle prime ricerche sull'argomento, 
l'attuale gruppo di lavoro ha definito a livello generale l'organiz¬ 
zazione del sistema e le principali funzionalità. Ovviamente, l'ini¬ 
ziativa potrà prevedere evoluzioni e ottimizzazioni sulla base dei 
requisiti della comunità, che possono variare a partire dai livelli 
di performance del sistema fino alla distribuzione delle responsa¬ 
bilità dell'assegnazione dei nomi, come già ipotizzato (Bellini et 
al., «Persistent Identifiers distributed System for Cultural Heritage 
digitai objects»; «Semantics-Aware Resolution of Multi-part Persi¬ 
stent Indentifiers») e in parte sperimentato («Persistent Identifier 
Distributed System for Digital Libraries, Information Technology»; 
«Persistent identifiers: jNBN, a JEE application for thè management 
of a national NBN infrastructure»). In questa fase, considerato il con¬ 
testo di start up, si è privilegiato un'organizzazione più centralizzata 
per esigenze di controllo e assessment del sistema. 

Il livello di persistenza 

NBN si propone un livello di persistenza molto alto. Nel contesto 
URN si possono identificare almeno tre livelli di persistenza: 

1. persistenza dell'identificatore. Se la risorsa non è più dispo¬ 
nibile in rete, l'identificatore URN può continuare ad avere 
senso (ad esempio come prova che in un determinato momento 
quella risorsa esisteva); 
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2. persistenza dell'abbinamento URN e URL. Si tratta di un impe¬ 
gno che garantisce nel lungo periodo che un URN sia sempre 
risolto (porti almeno a un indirizzo di tipo URL). Non viene 
garantita l'accessibilità della risorsa ma viene garantito - in 
caso di non disponibilità permanente della risorsa in rete - 
l'accesso alla c.d. tombstone (es. "questo ebook non è più in 
commercio"); 

3. persistenza della Risorsa referenziata da NBN. Assicurare nel 
lungo periodo l'esistenza e accessibilità della risorsa referen¬ 
ziata da URN. Questo è il livello di persistenza di NBN reso 
possibile solo dal deposito (legale o volontario) presso le biblio¬ 
teche nazionali e dalla descrizione autorevole della Bibliografia 
Nazionale. 


L'organizzazione 

Il servizio NBN propone un'organizzazione su due livelli: 

• il Registro Centrale dei nomi (RC) gestito dalla BNCF 

• i Content Provider (CP), cioè coloro che hanno le risorse che 
devono essere inviate verso il deposito legale. 

La richiesta di assegnazione del NBN avviene in modo decentra¬ 
to direttamente dai CP autorizzati, seguendo un certo criterio di 
selezione delle risorse e di accreditamento dei CP stessi. Le istitu¬ 
zioni accreditate riceveranno un sub-namespace (in genere l'acro- 
nimo dell'istituzione) che verrà utilizzato per la generazione dei 
rispettivi NBN. Ad esempio l'Università di Firenze potrebbe rice¬ 
vere il sub-namespace UNIFI. Il NBN risultante assumerà la forma: 
URN:NBN:IT:UNIFI-123456. Le istituzioni che riceveranno il sub- 
namespace dovranno inoltre necessariamente aderire a Magazzini 
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Digitali (Vignocchi, Bergamin e Messuti; «Le linee guida per l'acces¬ 
so aperto alle tesi di dottorato») per il deposito legale dei contenuti 
da loro prodotti. Questo è evidentemente un processo off-line che 
deve prevedere la necessaria flessibilità per gestire casi specifici. Ad 
esempio, nel caso in cui una istituzione abbia digitalizzato dei conte¬ 
nuti, ma non sia in possesso di un IR digitale, le risorse potrebbero 
essere inviate alla BNCF tramite canale offline (es. CD, DVD, etc.). 


7 


metadata 



Figura 1: Schema descrittivo di NBN in relazione con il sistema di Deposito 
Legale 

Come si evince dalla figura 1, il sistema NBN è formato da 3 ma- 
cro blocchi funzionali lato centrale e un plugin lato CR I tre blocchi 
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funzionali del sistema centrale sono: il Generatore, il Registro Cen¬ 
trale (RC) e il Resolver. Nei paragrafi seguenti vengono descritti gli 
elementi dal punto di vista delle loro funzioni principali tralasciando 
le modalità tecnologiche di implementazione. 

Il Registro Centrale NBN 

Il Registro Centrale (RC) è il cuore del sistema, il luogo dove ven¬ 
gono mantenute le associazioni NBN-URL. Una delle principali 
assunzioni di base per il RC è quella di non prevedere la gestione dei 
metadati descrittivi. Questa decisione si basa sia sulla complessità 
che sul costo di mantenere aggiornati i metadati presenti nei vari 
archivi collegati al deposito legale. In questo modo si evita di ricrea¬ 
re un nuovo catalogo e ci si focalizza sul servizio di identificazione, 
mantenendo invece un puntatore ai metadati autorevoli presenti 
negli archivi delle istituzioni. La distinzione tra fare un catalogo e 
un registro è sostanziale. Nel caso del RC di NBN si è provveduto 
a definire una serie di informazioni gestionali del nome stesso per 
monitorame lo stato, la tracciabilità delle modifiche, etc. Il registro 
quindi mantiene tutte le richieste, le azioni, le modifiche che avven¬ 
gono sul registro stesso al fine di garantire il trust complessiva del 
servizio. 


Il Generatore NBN 

Un NBN viene assegnato a quello che nella terminologia PREMIS 13 
viene identificato come representation. In altre parole un record 
formato da più file riceve un solo NBN. Inizialmente il NBN sarà 
assegnato alle tesi di dottorato visto che questa tipologia di oggetti 

13 Preservation Metadata: Implementation Strategies (PREMIS) è lo standard di 
metadati per la conservazione promosso da OCLC e RLG, http://www.loc.gov/ 
s tandards / premis . 
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è già oggetto di harvesting e deposito da parte di Magazzini Digita¬ 
li, ma è pensato per essere assegnato a tutte le risorse destinate al 
deposito legale e alle risorse frutto dei progetti di digitalizzazione 
condotti dalle biblioteche e da altre istituzioni. La stringa alfanume¬ 
rica è opaca e non darà alcuna informazione semantica (es. uso di 
parole specifiche), inoltre, avrà una lunghezza consona alle esigenze 
di citazione. Si è voluto evitare la complessità d'uso, ad esempio, 
dell'Universally Unique IDentifiers (UUID) che è problematico a 
causa della sua lunghezza di 36 caratteri complessivi 14 . Pertanto si 
è ritenuto opportuno generare un progressivo generale che non sia 
legato al sub-namespace, ma si basi su un contatore unico. 

Il Resolver NBN 

Il Resolver 15 è lo strumento che consente l'accesso alla risorsa ma 
allo stesso tempo anche la sua verifica, che se positiva, consolida 
e aumenta il trust del sistema, come precedentemente spiegato. Il 
Resolver è quindi l'interfaccia del servizio verso l'utente e il tipo di 
risposta che dà è effettivamente il livello di servizio offerto dal siste¬ 
ma. In generale una risoluzione di un NBN prevede la restituzione 
di una pagina intermedia con 

1. i metadati e il link alla risorsa presente nel IR del content 
provider ritenuto Trusted, 

2. le informazioni di stato del NBN e 

3. il riferimento alla copia della risorsa presente nel deposito 
legale. 

Questo è il livello di servizio principale dal quale poi è possibile 
evolvere verso sistemi più sofisticati in accordo alle esigenze della 

14 UUID, http://en.wikipedia.org/wiki/Universally_unique_identifier. 

15 I1 dominio di risoluzione sarà http://nbn.depositolegale.it. 
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comunità. È importante notare che il servizio di deposito legale ha 
tempi di harvesting diversi rispetto al flusso di pubblicazione delle 
risorse. L'intero workflow include quindi la presenza di un periodo 
di latenza tra la richiesta di registrazione del NBN per la risorsa e la 
sua effettiva archiviazione nel sistema MD. Questa latenza, però non 
andrà a inficiare il livello di servizio di risoluzione offerto. Infatti si 
assume che il servizio di risoluzione centrale sia in grado di risolvere 
il NBN dal momento in cui viene generato, a fronte della richiesta 
da parte dei CP e non solo dopo che è stato archiviato. 16 

Il plugin per gli IR 

Uno degli aspetti più critici di un sistema di identificazione non è la 
generazione del nome o il processo al termine del quale l'identifica- 
tivo viene assegnato, ma la sua concreta consegna al richiedente. La 
consegna implica una sorta di "uscita" dell'identificativo dal sistema 
generante per andare a inserirsi in uno spazio codificato del richie¬ 
dente (il posto della targa, la carta di identità, la tesserina del codice 
fiscale, etc.). A questo proposito l'obiettivo più importante era la 
consegna contestuale alla richiesta (quindi immediata) del NBN ge¬ 
nerato, così da entrare subito a far parte dei metadati descrittivi della 
risorsa. Questo approccio si differenzia, migliorandolo, da quello 
fino a oggi adottato dalla Biblioteca nazionale tedesca che prevede 
una attesa di 24/48 ore. Per ottenere questo risultato importante sia 
in termini di usabilità che di efficienza del sistema è stato sviluppato 
un apposito plugin, al momento adattabile per il software EPrints 17 
che consentirà il dialogo con il sistema centrale tramite web Service. 

16 L'interfaccia progettata per essere multilingue presenterà le informazioni 
necessarie sia sul servizio sia sulle modalità di partecipazione. 

17 È previsto a breve anche lo sviluppo di un plugin per DSpace, che con EPrints 
costituisce il software più utilizzato dalle università italiane per l'implementazione 
di open archives. 
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Il plugin modifica l'interfaccia del sistema di archiviazione usato 
dall'IR inserendo un elemento attraverso il quale l'operatore sarà 
in grado di richiedere la generazione del NBN da remoto. Questo 
strumento, come si vede dalla figura 1 a pagina 15, si inserisce nel 
workflow di pubblicazione e consente all'operatore di effettuare una 
richiesta di generazione del NBN prima della validazione finale del¬ 
la risorsa (pubblicazione) e solo per quelle risorse che già si intende 
inviare al deposito legale. 

Sperimentazione e nuove prospettive 

Grazie allo sviluppo dei plugin sarà possibile avviare ima prima 
sperimentazione del sistema NBN in collaborazione con il gruppo di 
lavoro Open Access della Commissione biblioteche della CRUI, coor¬ 
dinato da Roberto Delle Donne. Il gruppo di lavoro ha collaborato 
con il MiBAC e in particolare con le Biblioteche Nazionali Centrali 
alla implementazione di una procedura automatizzata per il deposi¬ 
to legale delle tesi di dottorato di ricerca 18 - i primi contenuti digitali 
a popolare Magazzini Digitali (Vignocchi, Bergamin e Messuti; «Le 
linee guida per l'accesso aperto alle tesi di dottorato»). Saranno pro¬ 
prio le tesi di dottorato di ricerca di alcune università che hanno 
già avviato con successo il deposito legale in Magazzini Digitali a 
ricevere i primi NBN e a testare le funzionalità del sistema. 19 Lo 
sviluppo di NBN beneficerà anche di un "ecosistema" costituito 
da una serie di attività correlate con i PI a cui che i partner dell'i¬ 
niziativa partecipano. Ad esempio, la Fondazione Rinascimento 
Digitale è leader del workpackage sulla citabilità e gli identificatori 
nel progetto europeo APARSEN. Tra i risultati del progetto vi è il 

ls http://www.crui.it/homepage.aspx?ref=1891 

19 La CRUI ha incaricato di questa prima sperimentazione l'Alma Mater Studio- 
rum, Università di Bologna e l'Università di Trieste rispettivamente per testare la 
compatibilità di archivi EPrints e DSpace. 
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rilascio di un nuovo framework di interoperabilità tra i vari sistemi 
di identificazione non solo per gli oggetti (NBN, DOI, Handle, etc.) 
ma anche per gli autori e le istituzioni. L'intento del documento 
è quello di definire una piattaforma comune di interoperabilità in 
grado di mettere in relazione queste entità e creare i presupposti per 
lo sviluppo di servizi avanzati a carattere sia metrico che semantico. 
Ai lavori partecipano organizzazioni come il CERN, l'Università di 
Trento, le biblioteche nazionali tedesca e inglese, gli archivi inglesi e 
molti altri partner. Le attività di sviluppo di NBN stanno già tenen¬ 
do in considerazione questa prospettiva e i nuovi sviluppi saranno 
intesi a rendere il sistema, primo in Italia, conforme al framework. 
Infatti il sistema NBN risponde ai criteri di trust identificati all'in¬ 
terno di APARSEN per i sistemi di PI. I principali criteri a cui NBN 
corrisponde positivamente sono: 

• esistenza di una Registration Autority; 

• esistenza di un Resolver accessibile su Internet; 

• garanzia dell'unicità dell'identificativo dentro il contesto (do¬ 
minio) di riferimento; 

• garanzia della persistenza del PI (sia a livello di funzionalità 
che di business model); 

• esistenza di policy per gli archivi che ricevono il PI per le 
proprie risorse; 

• risoluzione affidabile; 

• disaccoppiamento tra la specifica del PI e la URL di risoluzio¬ 
ne. 

In particolare, nel confronto con gli attuali sistemi, NBN:IT è del tut¬ 
to paragonabile al livello di trust ottenuto dal sistema della biblioteca 
nazionale tedesca sui medesimi criteri. 
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Un'altra importante iniziativa assunta dalla CRUI partner del 
consorzio NBN, è la responsabilità della gestione del cosiddetto DOl 
non commerciale. La CRUI, stipulando un accordo con DataCite, si 
è attivata per la distribuzione del DOI in particolare alle istituzioni 
scientifiche che vogliono identificare dataset, risultati della ricerca, 
articoli, etc. La simultanea presenza nel gruppo di NBN dei respon¬ 
sabili diretti di queste iniziative, consentirà straordinarie sinergie 
e uno sviluppo coerente di questi servizi con notevoli benefici per 
l'accesso, il riuso e la diffusione della conoscenza. 


Conclusioni 

La realizzazione di un sistema di identificazione persistente lega¬ 
to alla digitai preservation si propone come parte integrante delle 
infrastrutture nazionali e internazionali per la ricerca e i beni cul¬ 
turali in primis. L'adozione di identificativi persistenti contribui¬ 
sce alla definizione dei trust necessaria in particolare per quelle 
risorse sulle quali la società costruisce e stratifica il nuovo sapere. 
Occorre dire naturalmente che NBN non intende essere una solu¬ 
zione alternativa agli identificatori in uso nel mondo dei Linked 
Data. NBN è un identificatore indipendente dal protocollo di ri¬ 
soluzione ma può essere usato all'interno di Cool URI e offrire un 
importante servizio anche per i Linked Data (ad esempio il NBN 
URN:NBN:IT:UNIFI-123456 può essere usato come Cool URI nella 
forma http://nbn. depositolegale.it/URN:NBN:IT:UNIFI-123456). 

Ovviamente, come ogni servizio, il suo successo sarà valutato 
dal livello di integrazione negli attuali workflow di pubblicazione e 
produzione di contenuti, dall'accettazione da parte delle comunità e 
dalla sostenibilità economica. Per favorirne il successo, il consorzio 
si impegna a tenere in considerazione il contesto internazionale, rece- 
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pendone le principali direzioni e raccomandazioni, pur adattandole 
al contesto specifico italiano. 
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ABSTRACT: L'associazione di un identificatore persistente a una risorsa digitale è 
considerata oggi una best practice che contribuisce alla risoluzione del problema del 
reperimento affidabile delle risorse in rete. Attualmente si stanno affermando diverse 
tecnologie e standard come DOI, Handle e Cool URI con differenti peculiarità e livelli 
di servizio offerti. Tuttavia, all'interno delle comunità scientifiche e culturali e nel 
nascente semantic web, persiste la necessità di garantire l'autenticità, la provenienza 
e in particolare la conservazione delle risorse nel tempo. Il National Bibliography 
Number (NBN) nasce nel contesto del ruolo e delle responsabilità che le biblioteche 
nazionali hanno nel campo del controllo bibliografico universale ed è orientato verso 
l'identificazione di risorse che devono essere conservate nel lungo periodo. Il progetto 
coordinato dalle biblioteche nazionali di Firenze, Roma e Venezia, dalla Fondazione 
Rinascimento Digitale e dalla CRUI non è alternativo ai sistemi di PI attualmente in 
uso, ma ne completa l'offerta. 
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